Участник:WebCite Archiver

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
13,11
Добротная статьяДобротная статьяДобротная статья
Вклад этого участника в добротные статьи русского раздела Википедии можно оценить примерно таким числом
44,61
Хорошая статьяХорошая статьяХорошая статья
Вклад этого участника в хорошие статьи русского раздела Википедии можно оценить примерно таким числом
14,36
Избранная статьяИзбранная статьяИзбранная статья
Вклад этого участника в избранные статьи русского раздела Википедии можно оценить примерно таким числом


Бот архивирует ссылки, оформленные с помощью шаблона{{cite web}}, используя службу WebCite.

На момент обновления статистики (01:27 май, 26) в очереди находилось 34603 страниц и 118629 ссылок. Всего за время работы бот успешно заархивировал 552915 ссылок.

Код бота[править | править код]

Последняя версия исходного текста бота доступна в репозитории Github

Ссылки, которые не архивируются[править | править код]


Уже указывают на архивную копию

Участник:WebCite Archiver/IgnoreArchives


Сайты, которые часто запрещены к показу на WebCite правообладателем

Участник:WebCite Archiver/IgnoreBlacklisted


Получается нечитабельный текст

Участник:WebCite Archiver/IgnoreErrors


Есть тег «no-cache»

The caching attempt failed for the following reason: The given URL contained a no-cache tag. WebCite respects the author’s request to not have their web page cached.

WebCite
  • folha.uol.com.br
  • ctv.ca
  • bluesnews.com
  • chelseafc.com
  • dlib.eastview.com
  • 100.empas.com
  • inishturkisland.com
  • janes.com
  • ms-pictures.com
  • movies.nytimes.com
  • plastichead.com
  • secunia.com
  • sherdog.com
  • securitylabs.websense.com
  • whufc.com
  • worldsnooker.com
  • x-rates.com
  • xbiz.com
  • ifpicr.cz
  • sportovci.cz
  • nationalbanken.dk
  • fff.fr
  • izrus.co.il
  • blogs.yahoo.co.jp
  • groklaw.net
  • zonakz.net
  • antiaircraft.org
  • paclii.org
  • rfemmr.org
  • 3dnews.ru
  • art-catalog.ru
  • cio-world.ru
  • compulenta.ru
  • computerra.ru
  • www.crpg.ru
  • www.dishmodels.ru
  • domtest.ru
  • finam.ru
  • finmarket.ru
  • game-ost.ru
  • gatchina-meria.ru
  • glossary.ru
  • infuture.ru
  • interfax.ru
  • interfax-russia.ru
  • vybory.izbirkom.ru
  • liveinternet.ru
  • mountain.ru
  • astro-era.narod.ru
  • newsmusic.ru
  • kino.otzyv.ru
  • oval.ru
  • redstar.ru
  • render.ru
  • rg.ru
  • ruformator.ru
  • scrap-info.ru
  • soccer.ru
  • systematic.ru
  • translogist.ru
  • webapteka.ru
  • pdc.tv
  • zakon.rada.gov.ua
  • zakon1.rada.gov.ua
  • media.mabila.ua
  • cajt.pwp.blueyonder.co.uk
  • nufc.co.uk

Здравый смысл

Участник:WebCite Archiver/IgnoreSence


Технические ограничения

The caching attempt failed for the following reason: No files could be downloaded for the given URL. This is likely because

a) The URL is incorrect,
b) The site in question refuses connections by crawling robots, or
c) The site in question is inaccessible from the WebCite network
WebCite
  • -
  • armsport.am
  • naviny.by
  • animenewsnetwork.com
  • azlyrics.com
  • boston.com
  • cinnamonpirate.com
  • city-data.com
  • discogs.com
  • dpreview.com
  • encyclopedia.com
  • everyculture.com
  • facebook.com
  • filmreference.com
  • findarticles.com
  • gamespot.com
  • groups.google.com
  • news.google.com
  • aom.heavengames.com
  • historynet.com
  • intel.com
  • forum.ixbt.com
  • jame-world.com
  • tests.jeuxmac.com
  • london2012.com
  • nationsencyclopedia.com
  • ttcs.netfirms.com
  • oceandots.com
  • pqasb.pqarchiver.com
  • rottentomatoes.com
  • sciencedirect.com
  • slantmagazine.com
  • springerlink.com
  • stpattys.com
  • rogerebert.suntimes.com
  • visi.com
  • webelements.com
  • wheresgeorge.com
  • biolib.cz
  • futuretrance.de
  • rfid-handbook.de
  • structurae.de
  • voicesfromthedarkside.de
  • earthobservatory.nasa.gov
  • ncbi.nlm.nih.gov
  • ncdc.noaa.gov
  • zapraudu-mirror.info
  • voynich.nu
  • aerospaceweb.org
  • file-extensions.org
  • globalsecurity.org
  • hdot.org
  • iaea.org
  • mindat.org
  • solon.org
  • spatricksf.org
  • portal.unesco.org
  • unhcr.org
  • yellowribbon.org
  • ag.ru
  • championat.ru
  • computer-museum.ru
  • encspb.ru
  • fantlab.ru
  • gasur.ru
  • grwar.ru
  • nkj.ru
  • ozon.ru
  • perm.ru
  • really.ru
  • spartak-nalchik.ru
  • videoguide.ru
  • walkspb.ru
  • ati.su
  • www.google.com.ua
  • jl.sl.btinternet.co.uk
  • thesun.co.uk
  • timesonline.co.uk
  • traditionalmusic.co.uk

Нужно заменять ссылками на Викитеку

Участник:WebCite Archiver/IgnoreWikisourceTarget


Вместо {{cite web}} нужно использовать другой шаблон ({{книга}} или {{статья}}, например)

Участник:WebCite Archiver/IgnoreWrongTemplate